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(§) Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen 

(§) Die Erfindung betrifft ein Verfahren sowie eine Einrich- 
tung zum Betrieb einer sprachgesteuerten Einrichtung bei 
Kraftfahrzeugen, bei welchem/welcher die Sprache bzw. 
die Sprachbefehle Ober Sprachmustervergleich einer Ge- 
ratefunktion im Kraftfahrzeug zugewiesen wird. Um hier- 
bei zu erreichen, dafc nicht-katalogisierte Sprachbefehle 
und Funktionszuweisungen selbsttatig erlernbar und ka- 
talogisierbar sind, ist erfindungsgemafc vorgeschlagen, 
dass zusatzlich zu den vorgegebenen sprachbefehlsaus- 
losbaren Funktionen, durch Ad-hoc-Generierungen und 
-Zuweisungen von neuen Sprachmustern, ad hoc neue 
Funktionen ermoglicht werden, und dass diese Ad-hoc- 
Generierungen durch adaptive Transkription vorgenom- 
men werden. 
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Beschreibung 

Die Erfindung betrifft ein Verfahren sowie eine Einrich- 
tung zum Betrieb einer sprachgesteuerten Einrichtung bei 
Kraftfahrzeugen, bei welchem bzw. bei welcher die Sprache 5 
bzw. die Sprachbefehle iiber Sprachmustervergleich einer 
Geratefunktion im Kraftfahrzeug zugewiesen wird bzw. 
werden, gemafi Oberbegriff der Patentanspriiche 1 und 11. 

Einrichtungen dieser Art zur sprachgesteuerten Bedie- 
nung von Geraten innerhalb des Kraftfahrzeuges sind viel- 10 
fach bekannt. Sie dienen iibergeordnet dem Zweck den Fah- 
rer nicht mehr der Notwendigkeit einer l^stenbedienung 
wahrend des Fahrbetriebes zu unterwerfen und ihn damit 
abzulenken, sondem der Fahrzeugfuhrer kann bei der 
sprachgesteuerten Befehlseingabe seinen Blick vollig unab- 15 
gelenkt auf den VerkehrsfluB gerichtet halten. Neben diesem 
enormen Sicherheitsaspekt spielt natiirlich der Komfort da- 
bei eine nicht unerhebliche RoLle. 

Aus dem Stand der Technik, wie beispielsweise aus der 
US-Patentschrift 4 870 686, ist eine genereile sprachgene- 20 
rierte Steuerung von Geraten beispielsweise eines Telefons 
bekannt. Hierbei werden die Sprachbefehle zunachst als 
Sprachnachricht erfaBt und sodann beispielsweise durch 
Mustervergleich ausgewertet und entsprechenden Funktio- 
nen zugewiesen. 25 

Aus der EP 0 621 582 ebenso wie aus der EP 0 780 828 
ist eine Spracherkennung durch Mustervergleich bekannt, 
wobei unterschiedliche Sprachmuster auch zu einem Befehl 
zugehorig sein konnen, so dafi das System adaptiv eine Mu- 
stererkennung an den jeweils speziellen Bediener anpaBt. 30 

Aus der EP0 797 185 sind verschiedene Verfahren zur 
Spracherkennung bekannt. Zum einen konnen ausschlieB- 
lich fabrikatorisch festgelegte Einzelworte zu einem so fi- 
xierten Wortschatz zusarnmengestellt sein, der bei der 
Spracherkennung verwendet wird. Dabei kann das Verfah- 35 
ren auf einer Phonem-Erkennung basieren. 

Mit Phonem-Erkennung ist die Erkennung einzelner 
Laute gemeint. Hier konnen Verarbeitungsverfahren wie 
beispielsweise die Hidden-Markov-Modellierung verwen- 
det werden. Dabei werden die von einem Benutzer einge- 40 
sprochenen, digitalisierten Sprachsignale zunachst analy- 
siert und diesbeziigliche Merkmalsvektoren abgeleitet, die 
fur die Spracherkennung wichtige Informationen des 
Sprachsignales beinhalten. Die dabei ermittelten Merkmals- 
vektoren werden ausschlieBlich mit fur Phonem-Segmente 45 
typischen Prototyp-Merkrnalsvektoren verglichen, welche 
beispielsweise einem dazu vorgesehenen Speicher zugeord- 
net werden. Weitere Verfahren konnen auf der Verwendung 
sog. Templates basieren. Hierbei basiert die Sprachbefehler- 
kennung auf einem Ganzwortvergleich zwischen einem ein- 50 
gesprochenen digitalisierten Sprachsignal und den wahrend 
einer Training sphase eingesprochenen und zur sprecherab- 
hangigen Spracherkennung abgespeicherten Sprechproben, 
den sog. Templates. Beim zweitgenannten Verfahren wird 
bereits klar, dass hier grundsatzlich starker noch als bei dem 55 
oben beschriebenen Verfahren eine Festlegung von Sprach- 
befehlen vorher erfolgen muB. Das heiBt, die Spachbefehle 
konnen nicht erganzt werden, es sei denn, es werden auf 
recht aufwendige Weise neue Templates eingelesen und be- 
wertet, die dann auch den entsprechend neuen Funktionen 60 
zugewiesen werden miissen. 

Aus der DE 197 05 471 A 1 ist eine preiswerte Spracher- 
kennung bekannt, die mittels einer Enveloppen-Bewertung 
der Signale ebenfalls ganze Signalpakete bewertet, wobei 
bei der elektronischen Verarbeitung TVansversalfilter kombi- 65 
niert mit Perzeptronnetzen eingesetzt werden. 

Aus der EP 0 508 225 ist definitionsgemaB die Verwen- 
dung einer phone m-gestutzten Spracherkennung angege- 
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ben. Hierbei werden zu den naturlichen Phonems noch arti- 
fizielle Phonems hinzugenommen, um eine prazisere, spezi- 
fischere Erkennung zu erhalten. 

Aus der DE 195 33 541 CI ist eine Sprachbefehlseingabe 
fur Kraftfahrzeuge bekannt. Dabei werden adaptive Muster 
abgelegt, um die Sprachgewohnheiten unterschiedlicher 
Sprecher erkennen zu konnen und eine entsprechend prazi- 
sere Funktionszuweisung durchfuhren zu konnen. 

Den Verfahren insgesamt ist lediglich eine vorher festge- 
legte Muster- und Funktionsliste zugeordnet. 

Dabei werden spracheingabegesteuerte Eingaben, insbe- 
sondere beim sprachgesteuerten Betrieb der Audioanfage im 
Kraftfahrzeug verwendet. Hierbei ergibt sich jedoch das 
Problem, daB bei Fahrten auf langeren Strecken die Sender 
wechseln. Mit dem Wechsel der Sender wechseln natiirlich 
auch die iiber RDS ubermittelten Sendernamen. Herkomm- 
liche Verfahren und Einrichtungen sind dabei nicht in der 
Lage, hier eine entsprechende Berucksichtigung dieses 
Sachverhaltes miteinzubeziehen. 

Der Erfindung liegt somit die Aufgabe zugrunde, ein Ver- 
fahren sowie eine Einrichtung der gattungsgemaBen Art da- 
hingehend weiterzubilden, daB auch nichtkatalogisierte 
Sprachbefehl-Funktionszuweisungen selbsttatig erlembar 
und generierbar sind. 

Die gestellte Aufgabe wird hinsichtlich eines Verfahrens 
der gattungsgemaBen Art erfindungsgemaB durch die kenn- 
zeichnenden Merkmale des Patentanspruches 1 gelost. 

Weitere vorteilhafte Ausgestaltungen der verfahrensge- 
maBen Erfindung wird in den Anspriichen 2-10 angegeben. 
Hinsichtlich einer Einrichtung der gattungsgemaBen Art 
wird die gestellte Aufgabe erfindungsgemaB durch die kenn- 
zeichnenden Merkmale des Patentanspruches 11 gelost. 

Eine weitere vorteilhafte Ausgestaltung ist in Anspruch 
12 angegeben. 

Kern der Erfindung ist hierbei, dass zusatzlich zu vorge- 
gebenen sprachbefehlsausldsbaren Funktionen, wie sie so- 
zusagen katalogisiert abgespeichert sind, durch Ad-hoc-Ge- 
nerierung und -Zuweisung von neuen Sprachmustem, ad 
hoc neuen moglichen Funktionen ermoghcht werden, und 
dass diese Ad-hoc-Generierung durch adaptive Transkrip- 
tion vorgenommen wird. Dies heiBt mit anderen Worten, 
dass neue Funktionen, wie beispielsweise neue, iiber das 
RDS der Kfz-Audioanlage erfasste Sendernamen, automa- 
tisch transkribiert werden, in Sprachmuster zu den zugehori- 
gen Namen, und dass die zugehorigen neuen Sprachmuster 
nun der Liste der Sprachbefehle und der entsprechenden 
Funktionszuweisung hinzugefugt werden. 

Somit ist es dann moglich, dass ohne weitere Program- 
mierung, d. h. vollig selbsttatig, bei einkommendem Signal 
iiber die RDS-Codierung eines Sendemamens, der Sender- 
name als solches transkribiert wird in ein Sprachmuster. Das 
heiBt, dass der Fahrzeugfuhrer oder der Sprachbediener nun- 
mehr den neuen, mogiicherweise vorher noch nicht in der 
Auflistung der bekannten Sprachbefehle enthaltenen Sen- 
dernamen sprachgesteuert eingeben kann, und die vorherige 
bereits erkannte Funktionszuweisung zu diesem neuen 
Sprachmuster lasst dann wiederum den Aufruf dieses neuen 
Senders im Radio des Kraftfahrzeuges sprachgesteuert zu. 

In weiterer vorteilhafter Ausgestaltung werden die neuen 
Sprachmuster dann dauerhaft zur • elektronischen Liste der 
Sprachbefehle und der zugehorigen Sprachmuster hinzuge- 
fugt. 

Die Spracherkennung kann dabei phon em- basiert sein, 
womit die Auswertung einzelner Laute und nicht Gesamt- 
worte als solches der Mustererkenn verfahren zugeordnet 
sind. Dabei werden natiirlich auch die neuen Funktionen 
bzw. die zu den neuen Funktionen transkribierten neuen 
Sprachmuster phonem-basiert generiert bzw. auch transkri- 
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biert. Durch die Verwendung phonem-basierter Spracher- 
kennung ist es im iibrigen auch erst moglich eine solche 
nachtragliche Transkription vomehmen zu konnen. Eine an- 
dere Transkription als phonem-basierend ware ohnehin 
schwierig. 5 

In weiterer vorteilhafter Ausgestaltung ist vorgesehen, 
daB eine Sprachbefehlseingabe jeweils auf ein jeweiliges 
Gerat einwirkt. Dies ware beispielsweise bei einer Minimal- 
losung der Fall, wenn z. B. nur das Autoradio sprachbefehl- 
gesteuert werden soil. 10 

In weiterer vorteilhafter Ausgestaltung kann aber jedoch 
auch vorgesehen sein, dass eine gemeinsame Sprachbefehls- 
eingabe interobjektiv auf verschiedene Gerate einwirkt. Das 
heiBt, ausgehend von einer zentralisierten Sprachbefehlsein- 
gabe und Spracherkennung werden nunmehr verschiedene 15 
Gerate gesteuert. Hierzu muB dann noch auBer der Auswer- 
tung des Sprachmusters und der Erkennung der Zugehdrig- 
keit eines entsprechenden Befehles, auch noch das Gerat er- 
kannt werden, dem diese Funktion zugeordnet ist. 

In weiterer vorteilhafter Ausgestaltung ist angegeben, 20 
dass die Telefonanlage bzw. auch die Telefonanlage im spe- 
ziellen, nurnmem- oder pseudonymwahlgesteuert wird. Da- 
mi t ist gemeint, daB der Fahrzeugfuhrer entweder die Zif- 
fern nacheinander eingibt oder aber daB er eine auf ein Pseu- 
donym gespeicherte Telefonnummer aus einem Telefonspei- 25 
cher abruft. Beispielsweise unter dem Wort "Buro" dann die 
Nummer an seinem Arbeitsplatz gewahlt wird. 

In weiterer vorteilhafter Ausgestaltung ist angegeben, daB 
die Audioanlage mit Senderkennung sprachgesteuert wird, 
indem die jeweils ad hoc neuen Sendernamen und dgl. tran- 30 
skribiert und so ansteuerbar sind. 

Weiterhin kann vorgesehen sein, daB die Audioanlage mit 
Audiodatentragem und den dort zugewiesenen Daten bzw. 
ad hoc zugewiesenen Daten transkribierbar und somit an- 
steuerbar sind. Damit sind die Daten gemeint, die sich auf 35 
dem Datentrager selbst befinden. Hierzu konnen entweder 
Titelziffer oder auch die Auswahl einer speziellen CD aus 
einem CD-Wechsler gemeint sein. 

In weiterer vorteilhafter Ausgestaltung ist angegeben, daB 
die uber Telematikdienste oder World wide web (www)- 40 
Dienste ad hoc einkommenden Daten/funktionen ad hoc in 
sprachbefehlsansteuerbare Sprachmuster transkribiert wer- 
den. Hiermit ist die Einbeziehung auch der genannten Teie- 
matik oder www-Dienste gemeint. Uber diese Funkverbin- 
dung konnen Daten abgerufen werden, die fur sich wie- 45 
derum funktionsrelevant fur verschiedene Gerate innerhalb 
des Fahrzeuges sind. Dazu konnen die Telefonanlage, aber 
auch die Navigationsanlage relevant sein. Auch hierbei ist 
es auBerordentlich vorteilhaft, wenn neue einkommende Be- 
fehle sodann transkribierbar in Sprachmuster umsetzbar 50 
sind. Die so transkribierten neuen Befehle entstehen auto- 
matisch, d. h. ohne weitergehende Programmierung; d. h. 
den besagten neuen Funktionen sind ohne weitere Program- 
mierung wiederum sprachgesteuert aufrufbar sind. 

In weiterer vorteilhafter Ausgestaltung ist angegeben, 55 
dass Sprachmuster von extern, bspw. auch uber die Telema- 
tikdienste, oder World-wide web gesendet und im Fahrzeug 
empfangen werden konnen. Auf diese Weise kann das bord- 
eigene System durch den besagten Zugriff nach Extern "hin- 
zulemen". 60 

Bezogen auf die erfindungsgemaBe Einrichtung ist ange- 
geben, daB die Sprachbefehlseinheit, eine Funktionsdeu- 
tungseinheit sowie eine Transkriptionseinheit aufweist, mit 
welchen ad hoc neue Funktionen erfaBt und ad hoc in 
Sprachmuster transkribierbar, und in der Spracheinheit als 65 
funktionszuweisbares neues Sprachbefehlsmuster abspei- 
cherbar ist. 

Die besagten einzelnen Elemente, wie Funktionsdeu- 
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tungseinheit und Transkriptionseinheit mussen in der ent- 
sprechend dargestellten iogischen Abfolge auch chronolo- 
gisch zugreifend verschaltet sein. 

Vorteilhaft kann dabei sein, wenn die Sprachbefehlsein- 
heit, mit alien oben genannten Untereinheiten wie Funkti- 
onsdeutungseinheit, TVanskriptionseinheit und dgl. mehr zu 
einer zusammenhangenden Baugruppe zusammengefaBt 
sind. Uber den quasi im Fahrzeug zentralisierten Betrieb ei- 
ner einheitlichen Sprachbefehlseinheit sind dann eine Viel- 
zahl von Geraten anschlieBbar und das System ist dariiber 
hinaus mit der Zeit auch erweiterbar. Wichtig ist nur, daB die 
Kommunikation zwischen der Spachbefehlseinheit und den 
einzelnen Geraten dem gleichen Protokoll unterworfen sind. 

Eine Verbindung solcher Elemente untereinander inner- 
halb des Fahrzeuges kann dabei leicht und zweckmaBig 
durch die Verwendung von fahrzeugintemen Bussystemen 
erfolgen. 

Die Erfindung ist in der Zeichnung dargestellt und nach- 
folgend naher beschrieben. 

Das Blockschaltbiid zeigt hierbei sowohl die chronologi- 
sche Einbindung einzelner Elemente und ihr verfahrensge- 
maBes Zusammenwirken, sowie auch eine schematische 
Darstellung der Iogischen Verschaltung der erflndungsge- 
maBen Einrichtungselemente. 

Der hier nur angedeutete Fahrer fiihrt einen Sprachbefehl 
einem innerhalb des Kraftfahrzeuges angeordneten Mikro- 
phon oder einer Mikrophonanlage zu. Das Mikrophonsignal 
wird dabei einem Spracherkenner 10 zugefuhrt, der pho- 
nem-basiert ist. Phonem-basiert bedeutet, daB einzelne 
Laute ausgewertet werden und nicht Gesamtworte als sol- 
ches. Hierdurch wird das System insgesamt selektiver und 
vielseitiger. Nach erfolgter phonem-basierter Spracherken- 
nung erfolgt ein Sprachmustervergleich in einer entspre- 
chenden Vergleichseinheit 11. Ist das entsprechende Sprach- 
muster erkannt und festgelegt, so erfolgt hernach innerhalb 
der Transformationseinheit 12 die Zuordnung des ermittel- 
ten Sprachmusters zu einer Funktion eines Gerates. 

Von der Transformationseinheit 12 aus wird dann ein ent- 
sprechendes Gerat angesteuert, was hier mit der Bezugszif- 
fer 20 stellvertretend gekennzeichnet ist und entweder ein 
Telefon mit Simcard, einem Radio mit RDS, ein CD-Wechs- 
ler, eine internetfahige Kommunikationseinheit oder eine 
Telematikeinheit sein kann. Hierbei werden in den genann- 
ten Einheiten die entsprechenden Befehle sprachgesteuert 
generiert. Ebenso konnen die Gerate wie Telefon, Radio 
oder aber auch Navigationseinrichtung und dergleichen 
mehr, Signale von auBerhalb empfangen. Hierzu konnen 
entweder abgerufene Navigationsdaten gehoren oder Tele- 
matikdienstdaten oder Telefondaten oder RDS -Daten der 
Audioanlage. 

Die empfangenen Daten konnen Funktionen entsprechen. 
Tun sie dies, so wird eine solche Funktion oder ein Sende- 
marae oder dergleichen erkannt, und hernach in einer Tran- 
skriptionseinheit 13 wird der Funktion ein Sprachmuster zu- 
geordnet. Dieses Sprachmuster wird sodann nach erfolgter 
Transkription in der Transkriptionseinheit 13 der Sprachmu- 
sterspeichereinheit 14 zugefuhrt. Dort erfolgt die Hinzufu- 
gung als Sprachmuster zu einem funktionszugewiesenen 
Befehl. An der Stelle schlieBt sich wiederum der Kreis und 
der Spracherkenner 10 nimmt diesen zusatzlichen Sprachbe- 
fehl bzw. das dazugehorige Sprachmuster auf. 

Insgesamt ist die Anlage somit in der Lage, neue Funktio- 
nen zu "lernen" und das dazugehorige Sprachmuster ohne 
vorherige Verfugbarkeit in einem Speicher selbsttatig neu zu 
programmieren. Dies ergibt einen erheblichen Gewinn im 
Bedienungskomfort, zum anderen erhoht es auch die Sicher- 
heit, weil der Fahrzeugfuhrer in bester Weise unterstiitzt 
wird, ohne ihn vom Fahrgeschehen abzulenken. 
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Patentanspriiche 

1 . Verfahren zum Betrieb einer sprachgesteuerten Ein- 
richtung bei Kraftfahrzeugen, bei welchem/welcher die 
Sprache bzw. die Sprachbefehle iiber Sprachmusterver- 5 
gleich einer Geratefunktion im Kraftf ahrzeug zugewie- 
sen wird bzw. werden, dadurch gekennzeichnet, daB 
zusatzlich zu den vorgegebenen sprachbefehlsauslos- 
baren Funktionen, durch Ad-hoc-Generierungen und - 
Zuweisungen von neuen Sprachmustem, ad hoc neue 10 
Funktionen ermoglicht werden, und dass diese Ad-hoc 
Generierungen durch adaptive Transkription vorge- 
nommen werden. 

2. Verfahren nach Anspruch 1, dadurch gekennzeich- 
net, daB die neuen Sprachmuster zur elektronischen 15 
Befehlsliste der Sprachbefehle und der dazugehorigen 
Sprachmuster hinzugefiigt werden. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekenn- 
zeichnet, daB die Spracherkennung phonem-basiert ist. 

4. Verfahren nach Anspruch 2, dadurch gekennzeich- 20 
net, daB die aus den neuen Funktionen transkribierten 
Sprachmuster phonem-basiert generiert bzw. transkri- 
biert werden. 

5. Verfahren nach einem der vorhergehenden Ansprii- 
che, dadurch gekennzeichnet, daB eine Sprachbefehls- 25 
eingabe jeweils auf ein jeweiliges Gerat einwirkt 

6. Verfahren nach einem der vorhergehenden Ansprii- 
che, dadurch gekennzeichnet, daB eine gemeinsame 
Sprachbefehlseingabe interobjektiv auf verschiedene 
Gerate einwirkt. 30 

7. Verfahren nach Anspruch 5 oder 6, dadurch gekenn- 
zeichnet, daB die Telefonanlage nummern- oder pseu- 
donymwahlgesteuert wird. 

8. Verfahren nach Anspruch 5 oder 6, dadurch gekenn- 
zeichnet, daB die Audioaniage mit Senderkennung 35 
sprachgesteuert wird, indem die jeweils ad hoc neuen 
Sendemamen oder dergleichen transkribiert und so an- 
steuerbar sind. 

9. Verfahren nach Anspruch 5 oder 6, dadurch gekenn- 
zeichnet, daB die Audioaniage mit Audiodatentragern 40 
und den dort zugewiesenen Daten bzw. die ad hoc zu- 
gewiesenen Daten transkribierbar und so ansteuerbar 
sind. 

10. Verfahren nach Anspruch 5 oder 6, dadurch ge- 
kennzeichnet, daB die uber Telematikdienste oder 45 
world wide web (www)-Dienste ad hoc einkommenden 
Daten/Funktionen ad hoc in sprachbefehlsansteuerbare 
Sprachmuster transkribiert werden. 

11. Verfahren nach einem der vorhergehenden An- 
spriiche, dadurch gekennzeichnet, daB iiber Telematik- 50 
dienste und/oder world wide web(www)-Dienste 
Sprachmuster zur Sprachbedienung ubersendet wer- 
den. 

12. Einrichtung zum Betrieb einer sprachgesteuerten 
Einrichtung bei Kraftfahrzeugen, bei welchem/welcher 55 
die Sprache bzw. die Sprachbefehle iiber Sprachmu- 
stervergleich in einer entsprechend elektronischen 
Spracheingabeeinheit, einer Geratefunktion im Kraft- 

f ahrzeug zuweisbar ist, dadurch gekennzeichnet, daB 
die Sprachbefehlseinheit eine TVansformationseinheit 60 
(12) sowie eine Transkriptionseinheit (13) aufweist, 
mit welchen ad hoc neue Funktionen erfaBt und ad hoc 
in Sprachmuster transkribierbar und in der Sprachmu- 
sterspeichereinheit (14) als funktionszuweisbare neue 
Sprachbefehlsmuster abspeicherbar sind. 65 

13. Einrichtung nach Anspruch 11, dadurch gekenn- 
zeichnet, daB alle der Sprachbefehlseinheit zugeordne- 
ten Untereinheiten (10, 11, 12, 13, 14) zu einer zusam- 



menhangenden Baugruppe zusammengefafit sind. 
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